查看原文
其他

我们能用星巴克指数来判断一个城市的经济水准吗?

王龙 极海 2023-10-13



01

一个成功的理论并不需要是最准确的理论,足够简单有时候更重要

想象一下如果你能通过观察大街上女性裙子的长短,而不是一大堆复杂到让人脱发的计算数据来预测经济的股票走势,那你一定是别人眼中更富有“洞察”的那个人。


1926年,经济学者乔治·泰勒提出了著名的“裙摆理论”,该理论表明,女装的边缘会随着股票价格的上涨而上升。泰勒是一个著名的劳资关系方面的专家,在他的职业生涯中,泰勒解决了2000多次罢工,但至今为人所津津乐道的,却是裙摆指数,不知道这对他是幸运还是不幸。


类似的理论还有很多,靠谱的不靠谱的都有,它们的流行自然有其富有话题性的一面,但更重要的原因还是这些理论都在试图构建一种运用简单指标得到重要结论的关联性模型,我们的大脑对这种取巧的方法总是求知若渴。


我并不认为这有什么不对,运用这种技巧在大多数情况下都是非常高效的。为什么广告总喜欢强调自己的销量领先,销量大产品就一定好吗?不一定,销量和产品质量没有直接关系,但销量好总有他卖的好的道理——它不一定对,但大概率对,又足够简单,这就足够了。


显而易见,越简单的模型通用性越强,越复杂的模型限制也越大。当我们尝试用更易获取和处理的信息去构建一个有效的模型,我们称之为“洞察”,当我们尝试用更多数据更全维度去构建一个有效的模型,我们称之为“大数据”。


构建模型并不难,难的是如何判断模型的有效性。所以要让洞察变得真正有价值,必须把洞察放到更多的例子中去不断验证。只有经过验证的洞察才是知识。


02

我们能用星巴克门店的多少来判断一个城市的经济水准吗?

戴德梁行曾发布过一个“星巴克指标”,认为一座城市的星巴克越多就越有活力和竞争力。21世纪经济研究院也认为,星巴克的门店数量,是衡量一个地区商业与消费活跃程度的指标,侧面反映了一座城市或一个区域的投资价值。


这一观察可能是符合直觉的,但个人直觉很难形成共识,至少深圳人对星巴克指数的认可度肯定就不如杭州人。(注:截至目前,星巴克在深圳223家,杭州301家)


 数据来源于极海|GeoHey 极海品牌监测


为了获取一个量化的结果,我们需要构建一个新的指标,将大家认可度较高的城市排行榜与按星巴克门店数量排序的的城市排行榜进行对比,使用SequenceMatcher函数做序列差异比较,排序完全相同为1,完全不同为0,以此得到一个相似性指数。


2.1 城市排行榜:《2020城市商业魅力排行榜》


城市分级排行并没有一个绝对客观的标准,不同的行业、个人出于不同研究的目的、方向往往有自己的一套标准。这里我们以新一线城市研究所10月18日发布的 《2020城市商业魅力排行榜》为依据,城市等级与排名如下——


▲ 受篇幅限制,仅展示三线以上城市


2.2 星巴克门店数量城市排行榜


通过极海品牌门店监控数据(https://stores.geohey.com),我们获取了星巴克目前在不同城市店铺数量的排名如下——


▲ 仅包含有星巴克门店的城市


2.3 相似性指数:0.67


通过对两张表格的相似性分析,得到计算结果仅为0.67——从数值上来看并不算一个很优秀的拟合指标。



通过对比城市列表,我们发现问题主要出在两方面。一是长三角城市群对咖啡文化接受度较高,有更强的消费偏好,咖啡消费的地域性限制了星巴克在全国的代表性。


 数据来源于极海|GeoHey 极海品牌监测


二是星巴克的市场下沉程度不高,在三四线城市分布较少,从而影响到了对城市的代表性。


 数据来源于极海|GeoHey 极海品牌监测


03

什么品牌指数最能代表城市发展等级?

数值本身没有意义,星巴克的0.67虽然不高,但如果其他品牌的相似度更低,那他仍可以算的上是一个好的指标。但我猜测麦当劳、肯德基这样的快餐连锁品牌可能具有代表性。


于是我们用同样的方法将极海品牌监测(https://stores.geohey.com/)数据库中的600+家连锁品牌依次进行相似性分析。令人惊喜的是,我们发现了一些拟合度极佳的品牌,如“必胜客”和“优衣库”。同时也惊奇的发现,麦当劳和肯德基的拟合程度并不高。



为了方便比较,我们将相似度前5的品牌(必胜客、优衣库、卡西欧、百丽、海底捞),连同大家认知里代表性较强的三个品牌(肯德基、麦当劳、星巴克)按照城市等级排名整合到一个表格中,并用颜色的深浅代表品牌门店的数量。理论上,从红到绿颜色过渡越自然的品牌和城市等级排名的相似程度就越高。


▲ 受篇幅限制,仅展示三线以上的部分城市


表格也可以直观观测到,必胜客和优衣库的相似度是最高的。但在具体的使用中,由于必胜客门店数量(2385家)要远大于优衣库的门店数量(813家),城市间的区分度更高,因此也更具有可比性。


从必胜客的门店分布上可以看出,必胜客开店的地域性并不强,市场下沉也让他的数据更具有代表性。


 数据来源于极海|GeoHey 极海品牌监测


现在我们似乎得到了一个更有用的指数——必胜客指数:一个城市的必胜客门店数量越多,发展等级也越高。


现在我们用必胜客门店数量为标准重新对城市进行排序(门店数相同的按新一线的顺序排列),进一步观察必胜客指数的有效性,城市划分依据及排行如下——



这份榜单和你的预期如何呢?客观来说,无论如何分类,都无法让所有人满意。所以让我们回到一个更核心的问题,那就是我们为什么需要做城市分级?


当一个个体问这个问题的时候,可能是为了选择未来发展的城市;当企业问这个问题的时候,可能是为了拓展新的市场;当政府问这个问题的时候,可能是为了规划城市未来的发展目标。不同的目的就会有不同的指标体系,同一目的不同的偏好也可能会有截然不同的指标取向。


所以,我并不是想告诉你谁是一线城市、谁是新一线,而是在提供一种利用简单方法对城市进行分类的思路,探索城市与品牌数据的更多可能性。


04

写在最后

  • 用品牌连锁门店数量去印证一个城市的发展水平是一个非常有趣的话题,他使用的数据足够简单、直接,得出的结论又受人重视,富有洞察。

  • 但我们不能用主观的感受论证这种关联性,轻易的去相信某个结论,即使他很符合你的直觉。真正的洞察一定是要经过验证的,未经验证的“洞察”只是观点和假设。

  • 对数据的应用而言,单纯的知道一个数并没有意义,你得了解数字背后的意义,这就是拉开数据工作者差距的关键——经验。同样是必胜客的门店数据,有的人能从中关联到城市发展水平的差异,有的人只能看到门店数据本身。

  • 关联性不是因果性,不能通过多开必胜客印证城市发展了。


图、文 / 王龙




零售行业专题目录

 业务专题 

 技术专题 


零售行业观点目录


点击阅读原文,了解极海更多行业探索

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存